Les choix d'OpenAI pour GPT-4o mini | Silicon

Clément Bohic - Silicon - 19/07
Un modèle GPT-4o mini rejoint le catalogue d'OpenAI. De la conception à l'évaluation, il a fait l'objet d'arbitrages.

MMLU, encore pertinent pour évaluer les LLM ?

Hugging Face, qui a récemment revu les fondements de son leaderboard, a choisi d’en écarter ce benchmark référent. Motif : il est devenu « trop simple », certains modèles atteignant le niveau de performance de l’humain. Parfois parce qu’ils ont été (sur)entraînés sur des données ...
[Courte citation de 8% de l'article original]

Loading...